“CCTV가 많으면 범죄율을
낮추는 데에 도움이 될까요?”

출처: 서울시 공공데이터포털 (https://data.seoul.go.kr/)
상관계수 분석

범죄건수 주요 변수

상관 관계 높은 변수 임의 선택

VS Stepwise로 변수 선택
서울시 치안 기준 군집화
상관계수가 높은 변수를 활용해서,
비슷한 치안 특성을 가진 구를 찾기위해
저희는 K-Means 클러스터링을 사용했습니다.

K-Means 클러스터링이란?
유사한 특성을 가진 데이터를 자동으로 그룹으로 묶는 비지도 학습 기법
사용자가 군집 개수(K)를 정하면,
K개의 중심점을 기준으로 데이터를 그룹화하고,
각 데이터를 가장 가까운 중심점에 할당합니다.
중심점을 반복적으로 조정하며 유사한 데이터끼리 묶는 군집을 만듭니다.
서울시 자치구별 ‘구별_경찰수’, ‘유흥업소_개수’, ‘총생활인구수’, ‘cctv’ 등을 기준으로 치안 특성이 비슷한 지역을 자동으로 군집화하기 위해 사용했습니다.

하지만 분석 결과는…?
